iT邦幫忙

2024 iThome 鐵人賽

DAY 2
1
AI/ ML & Data

資料科學的小筆記系列 第 2

Day2: 使用dplyr轉換資料-Summarize Cases

  • 分享至 

  • xImage
  •  

雜談:
找回昨天遺失的雜談草稿,就保留起來給大家看看了XD

先前在學習或撰寫程式的過程中,時常會參考iT邦幫忙或鐵人賽的內容,自己一直都想挑戰看看,但不知道該如何下手或有什麼可以分享的內容。然而,在友人的組隊邀約下,以及到新職場環境下需要重拾學生時代使用的R語言,決定挑戰30天寫點小東西當作自己的小筆記,可能會有些R語言、Python或自己之前碰過的雜七雜八內容,最終目標是希望自己挑戰30天寫東西成功,剛好路過的讀者們就隨意看看囉XDD

正文:
今天要利用dplyr套件針對資料進行轉換(Data Transformation),依照dplyr的cheat sheets提及的前提:dplyr的函式可以配合pipes(|>)使用,並且需要是整潔的資料(Tidy Data),整潔的資料指的是符合以下兩點的資料:(1)每個變數都在其欄位中 (2)每個觀測值都在其列中,當有這樣資料後就可以來使用相關的語法了。

以R內建的mtcars為例就是一個Tidy Data

View(mtcars)

https://ithelp.ithome.com.tw/upload/images/20240813/20168607T4Y9xZ0EWX.png

首先先下載dplyr套件並載入

install.packages("dplyr")
library("dplyr")

今天先練習Summarize Cases
Summary function能將向量轉成單一值,函式包括

  1. summarize(.data, ...):計算匯總表
  2. count(.data, ..., wt = NULL, sort = FLASE, name = NULL):計算每個...設定的分群中的每列數量
mtcars |> summarize(avg = mean(mpg))

https://ithelp.ithome.com.tw/upload/images/20240813/20168607xeZx5VBgl0.png

mtcars |> count(cyl)

https://ithelp.ithome.com.tw/upload/images/20240813/20168607jI9OdVEskG.png

今天的小筆記就先到這邊,大家明天見~~

參考資料:Data transformation with dplyr :: Cheatsheet


上一篇
Day1: R語言的Cheat Sheets
下一篇
Day3: 使用dplyr轉換資料-Group Cases
系列文
資料科學的小筆記5
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言